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Abstract of DEI 9861088 

In addition to one or more subassemblies, an extra identical subassembly is provided. A multiplexer is 
connected to the inputs to the subassembly and connects the input bus of one subassembly to the 
following subassembly. The outputs of the subassembly are connected to a multiplexer which receives 
the output bus of each subassembly from the respective following subassembly. In the event of a 
defect in one of the subassemblies, the multiplexers are switched to replace the faulty subassembly 
with the following one, and so on unit the last subassembly is replaced by the extra subassembly. 
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Beschieibung 

1. Hintergrund der Erfindung 

5 1.1 Stand der Technik 

1.1.1 Mehrdimensionale Anays aus Rechcnwerken 

Aus DE 196 51 075.9-53 sind Prozessoren mit einer Mehrzahl von 2- oder mehrdimensional angeordneten Rechen- 
10 werken/Zellen bekannt. Die Rechenleistung derartige Prozessoren steigt mit der Zahl der vorhandenen Rechenwerken 
an. Daher wird versucht moglichst viele Rechenwerke auf einen Chip zu integrieren, wodurch die bendtigte Flache an- 
steigt. Mit steigender Flache, wachst gleichzeitig die Wahrscheinlichkeit, daB der Chip bereits bei der Herstellung Fehler 
aufweist und unbrauchbar ist. Demselben Problem unterliegen alle in Matrix-Form angeordnete Rechenwerke, z. B. auch 
andere bekannte bekannten lypen wie DPGAs, Kress- Arrays, Systolische Prozessoren und RAW-Machines; genauso 
15 wie einige Digitalen Signalprozessoren (DSPs), die inehr als ein Rechenwerk besitzen, 

Gleichzeitig sind aUen genannten lypen sehr testintensiv, d. h. um die Fehlerhaftigkeit nachzuweisen mussen beson- 
ders viele Testfalle in bezug auf die Funktion der Zellen und Vemetzung generiert und getestet werden. Herkommliche 
bekannte Methoden wie BIST, Boundary Scan, etc. sind aufgrund der erheblichen Menge an Testvektoren schlecht zu in- 
tegrieren und zu zeit- und platzintensiv. 

20 

1 . 1 .2 Standardprozessoren 

Standardprozessoren wiie beispielsweise die bekannte x86-Reihe, MIPS oder ALPHA besitzen mehrere Rechenwerke, 
die zeitversetzt oder durch einen VUW-Befehl gleichzeitig angesteuert werden. In Zukunft wird die Zahl der integrierten 
25 Recheneinheiten (Integer-Units) und FlieBkomma-Rech^wetke (Floating-Point-Unis) weiter ansteigen. Jedes der Re- 
chenwerke muB ausreichend getestet werden und weitestgehend fehlerfrei sein. 

1.2Probleme 

30 1 .2. 1 Mehrdimensionale Arrays aus Rechenwerken 

Durch die steigende Fehlerwahrscheinlichkeit bei groBen Chips konnen entweder nur sehr wenige Zellen integriert 
werden, oder die Produktionskosten werden bedingt durch den entstehenden AusschuB erheblich. Bei sehr groBen Chips 
wird eine maximale Flache erreicht, iiber der hinaus kein funktionsfahiger Chip mehr heigestellt werden kann. 
35 Durch den Zeitaufwand beim Testen nach herkommlichen Verfahren steigen die Testkosten stark an. Eingebaute 
BIST-Funktionen (Build In Self Test) verscbwenden durch hohen Zusatzaufwand sehr viel Flache, die die Kosten nach 
oben treibt und die Herstellbarkdt veiringert. Zudem steigt die Wahrscheinlichkeit stark an, daB ein Fehler nicht inn^- 
halb der eigentlichen Funktionseinheiten sonderen innerhalb der Ibststrukturen liegt. 

40 1.2.2 Standardprozessoren 

Durch die steigende Zahl der Rechenwerke steigt die Fehlerwahrscheinlichkeit an. Dadurch bedingt wird der Aus- 
schuB hoher, wodurch die Herstellungskosten steigen. Mit wachsender Rache und der damit verbundenen Steigerung der 
Transistormenge wachst die Ausfallwahrscheinlichkeit bei der Benutzung. 
45 BezUglich des Testaufwandes und der BIST-Implementierung gilt das bereits fiir "Mehrdimensionale Arrays aus Re- 
chenwerken" Gesagte. 

1.3 Verbesserung durch die Erfindung, Aufgabe 

50 GemaB der vorliegenden Erfindung ist es moglich defekte Zellen durch Funktionsfahige zu ersetzen und damit den 
AusschuB zu verringem. Dabei kann eine Ersetzung entweder mittels Testsystemen bei der Herstellung der Chips erfol- 
gen oder sogar beim Anwender im komplett aufgebauten System. 

Es ist moglich Testvektoren gemaB dem BIST-Prinzip innerhalb des Chips, als auch gemaB einem neuen Verfahren au- 
Berhalb des Bausteins zu generieren, um Flache und Kosten zu sparen. 
55 Weiterhin wird eine Moglichkeit beschrieben, wie Chips automatisch Defekte rq>arieren konnen, ohnc daB ein exter- 
nes zusatzliches Werkzeug dafiir notwendig ist. 
Samtliche Ibsts und Reparaturen konnen zur Laufzeit der Chips duichgeftihrt werden. 

2. Beschreibung der Erfindung 

60 

2.1 Detailbeschreibung der Erfindung 
2.1 . 1 Ersetzen defekter Zellen 

65 Einer Gruppe von Zellen, die im Weiteren in Anlehnung an DE 19 651 075.9-53 mit PAEs bezeichnet werden, wird 
eine zusatzliche, im normalen Betrieb nicht benutzte PAE zugeordnet (die im Folgenden PAER genannt wird). Die Zellen 
konnen Rechenwerke jeder Art, konfigunerbare (programmierbare) Logikzellen oder andere Cores beliebiger Funktion 
sein. Bei der Gruppierung der PAEs und der Zuordnung der PAER ist eine spalten- oder zeilenweise Gruppierung der 
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PAEs vorzuziehen, da hierdurch die Vemetzung vereinfacht wird. In Hinblick auf zukunftige Chiptechnologien, wird auf 
eine mogliche Gruppierung der PAEs innerhalb einer 3. Dimension hingewiesen. Vor die Eingange der PAEs werden der- 
art Multiplexer geschaltet, daB der Eingang ersten PAE in der Zeile/Spalte auch auf den Eingang der zweiten PAE in der 
Zeile/Spalte geschaltet werden kann, wobei dann auch der Eingang der zweiten PAE auf den Eingang der dritten PAE ge- 
schaltet wird und so weiter. Der Eingang der letzten PAE wird auf den Eingang der PAER geschaltet. Das bedeutet, daB 5 
bei einem Defekt der ersten PAE deren Funktion durch die Zweite, die Funktion der Zweiten durch die Dritte und so wei> 
ter ersetzt wird, bis die Funktion der letzten PAE durch die PAER ersetzt wird. 1st eine PAE innerhalb der Spalte/Zeile de- 
fekt, werden die vor ihr liegenden PAEs normal beschaltet und ab der Stelle der defekten PAE alle Funktionen um eine 
PAE verschoben. 1st beispielsweise die PAE 4 defekt, so fuhren die PAEs 1..3 ihre jeweilige Funktion aus, wahrend der 
Eingangsmultiplexer der PAE 5 so geschaltet isl, daB er die Daten der PAE 4 erhalt, der Eingangsmultiplexer der PAE 6 10 
erhalt die Daten der PAE 5 und so wdter, bis der Eingang der PAER die Daten der letzten PAE erhalt. 

Um die Ergebnisse wieder in der richtigen Reihenfolge der Vernetzung zuzufuhren werden an den Ausgangen der 
PAEs ebenfalls Multiplexer angebracht, wobei der Ausgangsmultiplexer der PAE 1 entweder die PAE 1 auf den Bus 
schaltet - sofem diese nicht defekt ist - oder bei einem Defekt den Ausgang d^ EAE 2 auf den Bus schaitet, an Stelle der 
PAE 2 wild dann die PAE 3 auf den Bus geschaltet, bis hin zur letzten PAE, an deren Stelle die PAER aufgeschaltet wird. is 
Befindet sich die defekte PAE in der Mitte der Zelle/Spalte, so erfolgt eine Verschiebung der Ausgange in genau der Art, 
wie sie fiir die Eingange bereits beschrieben wurde. Speziell bei konfigurierbarer Logik und konfigurierbaren Rechen- 
werken, treten zusatzliche Bussysteme auf, um die Konfigurationsdaten zu iibermitteln und die Konfiguration zu steuem. 
Diese Bussysteme werden entsprechend der in diesem Abschnitt genannten Busse ebenfalls iiber Multiplexer verschaltet. 
Gleiches gilt fiir die Bussysteme, iiber die bei einer matrixartigen Anordnung von Rechenwerken (z. B. Systolische Pro- 20 
zessoren, SIMD, etc), die Befehle in die jeweiligen Rechenwerke geschrieben werden. Grundsatzlich kann jeder Bus 
Oder jedes Signal iiber Multiplexer geleitet werden. Je nach Anforderung an die Ausfallsicherheit kann beispielsweise 
das Taktsignal Ub^ Multiplexer gefuhrt werden, um einem eventuellen Kurzschlufi vorzubeugen; oder das Ibktsignal 
wird direkt an die Zelle gefiihrt, well ein derartiger Ausfall nicht abgefangen w^den soil. Die Stufe der Ausfallsicherheit 
kann konstruktiv entsprechend den Anforderungen fiir jedes Signal oder jeden Bus einzeln festgelegt werden. 25 

2.1.2 Ersetzen defekter Busse 

Das vorgesteilte Konzept zur Fehlerkorrektur innerhalb von GattersUnkturen ist in gleicher Weise auf Bussysteme an- 
wendbar, Dabei wird einer Anzahl von Bussen (Bus 1... Bus n) ein zusatzlicher Bus (BUS R) zugeordnet. Ist einer der 30 
Busse defekt (BUS d), wird seine Funktion von einem seiner Nachbarbusse iibemommen (BUS (d + 1)). Die Funktion 
des Nachbarbusses (BUS (d + 1)) wird von dessen Nachbarbus (BUS (d + 2)) iibemommen, usw., wobei die Richtung des 
iibemehmenden Busse iramer die gleiche bleibt. So lange, bis BUS n durch BUS R iibemommen wird. Bei der Anwen- 
dung der Multiplexer-Strukturen auf Bussysteme werden entsprechend der vorUegenden Verbindungsstruktur und der 
Richtung der Daten gewohnliche Multiplexer, Dekoder und Gates, IHstate-Gatter, oder Bidirektionale Multiplexer ein- 35 
gesetzt. 

2.1.3 Dekoder 

Es ist ofifensichtlich, daB immer zwei Gruppen von aufeinanderfolgenden Multiplexern denselben Zustand annehmen 40 
massen,d. h. MUX 1 = MUX 2 = MUX 3 ==... = MUX n = Zustand A und MUX (n + 1)== MUX (n + 2) = MUX (n + 3) = 
... = MUX m = Zustand B. Ist keine PAE defekt gilt MUX 1 = MUX 2 = ... = MUX m = Zustand A. Ist die erste PAE de- 
fekt gilt MUX 1 = MUX 2 = ... = MUX m = Zustand B. 

Ist beispielsweise PAE 3 defekt gilt MUX 1 = MUX 2 = Zustand A, MUX 3 = MUX 4 = ... = MUX m = Zustand B, wo- 
bei in diesem Beispiel PAER der PAE m zugeordnet ist, d. h. PAER befindet sich direkt neben PAE ra. 45 

Die Ansteuerung der Multiplexer sieht daher beispielsweise wie folgt aus 



Defekte PAE 


Multiplexer 




Ansteuerung 


keine 


0000. . .000 


m 


0000. . .001 


m-1 


0000... Oil 


m-2 


0000. . .111 


4 


0001. . .111 


3 


0011. . .111 


2 


0111. . .111 


1 


1111. . .111 



Ist die PAER der PAE 1 zugeordnet, so ist die Reihenfolge m...l vertauscht (Defekte PAE 1 entsprichtOO(X)...001,bzw. 
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defektePAEmentspricht 1111... 111). 

Es ist daher ausreichend die Nummer der defekten PAE zu speichern und diese einem Dekoder zuzufiihren, der anhand 
der oben abgebildeten Tabelle die Zustande der Multiplexer ansteuert. 

S 2. 1 .4 Durchfuhrung des SeibsUests 

Grundsatzlich konnen beliebige Ibststrategien auf das Verfahren angewendet werden, wobei das folgende erfindungs- 
gemaBe Verfahren als besonders geeignet angesehen wird: 
Das Array aus PAEs wird mit einem oder mehieren .Ibstalgorithmen geladen, die ein oder mehrere Testvektoren be- 
10 rechnen. An einer Kante des Arrays werden die TAEs als Vergleicher geschaltet, so dafi die anhand der Testvektoren be- 
rechneten Werte mit den Sollergebnissen veiglichen werden. Entspricht das berechnete Ergebnis nicht den Sollergebnis* 
sen liegt ein Fehler vor. Die Testdaten, also die Ibstalgorithmen, die Testvektoren und die SoUergebnisse liegen dabei in 
einem intemen oder extemen Speicher vor od^ werden von einer iibeigeordneten Einheit geladen. Es ist bei dieser Ibst- 
strategic notwendig, daB ein jeder Testalgorithmus mindestens zweimal berechnet wird, wobei beim zweiten Mai die als 
15 Vergleicher ausgestalteten PAEs an einer anderen Kante liegen (vorzugsweise der gegeniiberliegenden), um eine Ausfuh- 
rung des Testalgorithmusses auf alien PAEs zu gewahrleisten. 

Ebenfalls ist es denkbar, daB die Vergleicher im Inneren des PAE-Arrays angeordnet sind und von links und rechts 
(oben und unten) jeweils ein Testalgorithmus A und B je ein Eigebnis A und B berechnet, wobei die Eigebnisse den Ver- 
gleichen zugeflihrt werden und iibereinstimmen mussen. 
20 Abhangig von der Art des Testalgorithmusses kann die fehlerfaaft PAE anhand des Fehlers zuriickverfolgt werden oder 
nicht. Unt^tUtzt der Algorithmus eine Zuriickv^olgimg, so warden die entsprechenden Multiplexer-Zustande der Zei- 
le/Spalte in der sidi die defekte PAE befindet geandert und den Multiplexem zugefUhrt Der Testalgorithmus, bei dem der 
Test fehlschlug wird emeut ausgefUhrt um eineFehlerfceiheit, die nun gegeben sein sollte zu tiberpriifen. Ist der Baustein 
weiterhin fehlerhaft, muB (IbeiprUft werden, ob eventuell weitere oder andere TAEs defekt sind. Dabei ist die AusfUhning 
25 des Testalgorithmusses und die Generiening der dem Fehler angepaBtra Multiplexerzustande iterativ. 

Oblicherwdse ist es nicht ausreichend nur einen Testalgorithmus zu implementieren, vielmehr milssen mehrere unter- 
schiedliche Testalgorithmen implementiert sein, die jeweils mit mehreren Testvektoren gepriift werden. Nur so ist eine 
maximale Fehlererkennungsrate zu erreichen. Gleichzeitig muB die Busvemetzung von Testalgorithmus zu Testalgorith- 
mus geandert werden, damit auch die Bussysteme ausreichend gepriift werden. Auf die verschiedenen Ausfiihrungen der 
30 Testalgorithmen wird in nicht naher eingegangen, da dies fiir das erfindungsgemafie Grundverfahren nicht relevant ist. 

2.1.5 Interne Steuerung des Selbsttests 

Bausteinen wie DE 196 51 075.9-53, DPGAs, Kress-Arrays, Systolische Prozessoren und RAW-Machines gemein- 
3S sam ist ein integrierter Speicher, der einem oder mehreren PAEs zugeordnet ist und die Funktion des/der Rechenweiice 
bestimmt. 

Entsprechend des BIST Grundprinzips wird der Speicher um einen Bereich (IbstMEM) erweitert, der die Testalgmth- 
men und -vektoren enthalt Dabei kann dieser Speicher fest in Form eines ROMs oder wiederbeschrdbbar mittels 
(E)EPROM, Flash-ROM, NV-RAM oder ahnlichem ausgestaltet sein. 
40 Um einen Selbsttest durchzufiihren wird an eine Speicherstelle innerfaalb des TestMEM gesprungen und die dort ab- 
gelegte Testroutine ausgefUhrt (Internal Driven Self Test = XDST)- Dabei sind auBer der Erweiterung des Speichers (um 
den TestMEM) und einer Auswerteeinheit fur die bereits beschriebenen Vergleicher (EnorCHK) keine weiteren BIST- 
typischen Zusatzbaugruppen auf dem Chip notwendig. 

45 2. 1 .6 Exteme Steuerung des Selbsttests 

Durch die Verringerung der Baugruppen auf eine Speichererweiterung (TfestMEM) und einer Auswerteeinheit der Ver- 
gleicher (ErrorCHK) wird eine weitere noch kostengunstigere und platzsparendere Variante ermoglicht Dabei wird kein 
interaer TestMEM implementiert, vielmehr wird der gewohnliche interne Speicher von auBen mit dem Tbstaigorithmus 

SO und den Testvektoren geladen (External Driven Self Ibst = EDST); das bedeutet, die BIST-Ibstdaten werden nach auBen 
verlagert und wie ein normales Programm betrachtet. Danach wird derlbstalgorithmus ausgefuhrt Alternativ kann der 
Testalgorithmus auch wahrend der AusfUhning sucessive aus einem extemen Speicher geladen und dekodiert werden. 
Lediglich die EnorCHK-Einheit muB noch auf dem Chip integriert sein. Um den Ibstalgorithmus und die Testvektoren 
von auBen in den/die chipintemen Speicher zu laden gibt es mehrere Moglichkeiten. Prinzipiell kann der \brgang durch 

55 eine fiinktioneli ubergeordnete CPU oder Recheneinheit (HOST) erfolgen, in dem diese die Ifestdaten (Testalgorithmus 
und Testvektoren) auf den Chip ladt (Download) oder der Chip ladt die Tfestdaten selbstandig aus einem extemen (Dual- 
ported-)RAM oder Festspeicher wie ROM, (E)EPROM, Flash-ROM, NV-RAM, o. a. 

2.1.7 Oberpufiing der Funktion zurLaufzeit 

60 

BIST- Verfahren nach dem Stand der Technik fuhren den Selbsttest fur gewohnlich nur wahrend der RESET-Phase, 
also kurz nach dem Anlegen der Spannung (dem Einschalten), des Chips durch. Im (jegensatz dazu ist es moglich bzw. 
sinnvoll die in dieser Schrift beschriebenen Verfahren wahrend der Laufzeit der Ptogranune auf den Chips durchzufUh- 
ren. Beispielsweise kaim ein kompletter Test des Chips wahrend der RESET-Phase durchgefiihrt werden und jeweils ein 
65 Teil der vorhandenen Testdaten wahrend der AusfUhning des Anwenderprogrammes bzw. wahrmd sogenannter IDLE- 
Zyklen, das sind Zeitraume, in denen kein Progranun auf den Chips lauft, bzw. der Chip im Wartezustand ist. Dies ist 
ohne weiteres moglich, in dem wahrend den IDLE-Zyklen einer der Tbstalgorithmen im intemen Speicher angesprungen 
wird, bzw. vom extemen Speicher oder HOST in den Baustein geladen wird. Dabei ist es verstSndlicherweise moglich. 
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aus der Mehrzahl der vorhandenen Testalgorithmen und Testdaten partiell einen oder mehrere auszuwahlen, wobei die 
Anzahl der ausgewahlten Testdaten anhand der Lange des IDLE-Zyklusses festgelegt werden kann. Es konnen so lange 
neue Testdaten geladen werden, bis der EDLE-Zyklus durch das Eintreflfen neuer zu verarbeitender Daten oder eines neu 
abzuarbeitenden Programmes oder einer anderen Anforderung beendet wird, 

Eine weitere Moglichkeit ist das feste Integrieren von Teststratcgien in die Anwenderprogramme, um wahrend der 5 
Verarbeitung des Anwenderprograimnes Tests durchzufiihren. 

In beiden Fallen werden die relevanten Daten, die sich im Array befinden, vor dem Aufruf der TestalgorithmeD gesi- 
chert. £s bietet sich an, daB die Daten entweder in interne Speicherbereiche (vgl. I^CT04) oder die extern angeschlos- 
senen Speicher gesichert werden. Nach Ausfiibrung der Ibstalgorithmen werden die Daten vor der normaien Ptogramm- 
verarbeitung ziiriickgelesen. 10 

Eine Alternative zur Steigerung der Ausfiihrungsgeschwindigkeit besteht darin, neben jedem Register (Reg-n, n e N) 
ein zusatzliches, nur fiir die Testalgorithmen verwendetes. Register (TestReg-n, n e N) zu implementieren. Vor Ausfiib- 
rung der Testalgorithmen, werden iiber Multiplexer/Demultiplexer (Tore) die TestReg-n zugeschaltet und fur den Test 
verwendet. Die Reg-n bieiben unverandert. Nach Ausfuhrung der Tbstalgorithmen werden wieder die Reg-n zugeschal- 
tet. 15 

Sieht die Teststrategie vor, daB nur Zellen getestet werden, deren Daten im Folgendcn nicht mehr relevant sind, kann 
auf das Sichem und Laden der Daten auch verzichtet werden. 



2.1.8 Speicherung der Nununer der defekten PAE 

Wird eine PA£ (oder ein Bus) als defekt erkannt, mu6 deren (dessen) Nununer, also der Zuistandvektor (Defektken- 
nung) der zugeordneten Multiplexer gespeichert werden, zum einen um die Multiplexer anzusteuem, zum anderen um 
bei einem Neustart (RESET) des Chips sofort zur Verfiigung zu stehen. 

Hierzu kann die Defektkennung 



2.1.9 Automatische Generierung der Multiplexer-Zustande 



20 



25 



1 . Chip-inlem in einem programmierbaren Festspeicher ((E)EPROM, Flash-ROM, NV-RAM o. a.) gespeichert 
werden 

2. extern in einem programmierbaren Festspeichem ((E)EPROM, Flash-ROM, NV-RAM o. a.) gespeichert werden 

3. extern im HOST, inneriialb des auszufuhrenden Programmes, in dessen programmierbaren Festspeichem 
((E)EPROM, Flash-ROM, NV-RAM o. a. oder auf anderen Speichermedien (magnetische, optische, etc.) gespei- 30 
chert werden. 



35 



Ublicherwdse wird nach der Erkennung eines Defektes die defekte Zelle anhand des erkannten Fehlverhaltens zu- 
riickverfolgt. Das ist bei entsprechenden Ibstalgorithmen moglich, sofem ein ziisatzlicher Algorithmus zur Zuriickver- 
folgung des Fehlers existiert Bei Kontrolle des Tests durch einen HOST kann die Zuriickverfolgung auf dem HOST 
durchgefiihrt werden. Existiert jedoch kein HOST kann oftmals die Zuriickverfolgung nicht innerhalb des defekten 
Chips integriert werden oder ist zu aufwendig. 40 

Zur Losung wird vorgeschlagen einen ladbaren Zahler vor jedem Dekoder zu integrieren. Im Normalfall wird in den 
Zahler die Nummer der defekten PAE geladen, wonach der Dekoder die Zustande der Multiplexer wie bereits beschrie- 
ben ansteuert. Ist unbekannt, welche PAE defekt ist, kann der Zahler bei PAE 0 oder PAE m beginnend jede mogliche po- 
tentiell fehlerhafte PAE ansprechen, indem nach jedem erfolglosen Test der Zahlerzustand so lange (je nach Implemen- 
tierung) um eine PAE verringert (von PAE m aus zahlend) oder erhoht (von PAE 0 aus zahlend) wird, bis die defekte PAE 45 
erreicht wird und der Test ordenthch ablauft. Der nun erreichte Zahlerzustand wird als Zustandsvektor fiir die Ansteue- 
rung der Multiplexer gespeichert und representiert die defekte PAE. Wird kein fiinktionsfahiger Zahlerzustand festge- 
stellt, liegt entweder ein anderer Fehler vor (evtl. in einer andere m Reihe/Spalte oder ein Busfehler) oder es ist mehr als 
eine PAE defekt. 

Ein Nachteil bdm Einsatz von Zahlem ist, daB samtliche Mdglichkeiten permutiert werden milssen, bis die fehlerhafte so 
PAE gefunden wurde. 

Eine weitere Moglichkeit, die allerdings mehr Implemetierungsaufwand erfordert, ist daher der Einsatz von LookUp- 
Tabellen, die anhand des gerade ausgefuhrten Testalgorithmusses und des entstandenen Fehlerzustandes in ErrorCHK 
die entsprechende defekte PAE auswahlen. Dazu ist es jedoch notwendig, daB die Testalgorithmen und Lookup-Tabellen 
aufeinander abgestinunt sind. Auf die Abstinmiung soil jedoch nicht weiter eingegangen werden, da diese sehr chipspe^ 55 
zifisch und unabhangig vom Grundprinzip ist. 

2.1.10 Besondere Ausgestaltung fiir Standard-Prozessoren (Pentium, MIPS, ALPHA, etc.) 

Aktuelle und zukunftige Prozessoren enthalten eine Mehrzahl an Integer- und FlieBkommaeinheiten. Daher ist das be- 60 
schriebene Verfahren direkt auf diese Bausteine anwendbar, in dem jeweils eine zusatzliche Einheit implementiert wird 
und zur Verfiigung stehL Der Test der Prozessoren kann beim Hersteller, wahrend des Startvoiganges der Computer oder 
ebenfalls wShrend der Laufzeit stattfinden. Besonders sinnvoll ist dabei ein Test wahrend des Boot-\^anges, also dem 
Starten des Rechners nach einem Reset, der bei PCs vom sogenannten BIOS (Basic Input Output System), durchgefiihrt 
wird. Dabei konnoi die entsprechenden Zustandsvektoren der Multiplexer entweder auf dem ProzesscM: oder in extemen 65 
Speichem, beispielsweise der FC-intemen batteriegepufferten Echtzeituhr (RFC) abgelegt werden. 
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3. Zusammenfassung 

Das vorliegende Verfahren ermoglichl den Austausch defekler Einheiten, die in dieser Schrift als Rechenwerke ausge- 
staitet sind, jedoch generell jede beliebige Einheit eines Chips darstellen konnen, durch funktionstiichtige. Gleichzeitig 
5 wird ein Verfahren aufgezeigt, mit dessen Hilfe SelbsUests einfacher, kostengiinstiger und vor oder wahrend des Ablaufs 
des Anwenderprogrammes durchgefuhrt warden konnen. Dadurch wird die Ausfallsicherheit auch im Betrieb erheblich 
vergioBert, was insbesondere fur ausfallkritische Anwendungen wie Kraftwerksbetriebe, Luft- und Raumfahrt oder Mi- 
litar von besonderer Bedeutung ist. 

10 4. Kurzbeschreibung der Diagramine 

Die folgendeDiagramme zeigen zur Verdeutlichung Ausfuhrungsbeispiele des erfindungsgemaBen \^rfahrens: 
Fig. 1 Grundschaltung 
Fig. 2 keine PAE defekt 
15 Fig. 3 PAEl defekt 
Fig. 4 PAEm defekt 

Fig. 5 PAE3 defektFig. 6 Array aus PAEs mit PAERs 
Fig. 7 Fehiertolerantes Bussystem 
Fig. 7a Prinzip eines Selbsttests erster Teil 
20 Fig. 7b Prinzip eines Selbsttests zweiter Teil 

Fig. 8a £DST in einem extemen ROM integriert 

Fig. 8b EDST in einen extemen RAM-Bereich integriert 

Fig. 8c EDST direkt vom HOST gesteuert 

Fig. 9 Beispiel eines chipiotemen Speichers mit BIST-Funktion integriert in eine inlem& Steuereinheit nach 
25 DE 196 54 846.2 

Fig. 10 Beispiel eines fehlertoleranten Standard-Prozessors 
Fig. 1 1 Ablaufdiagramm eines Selbsttests 

Fig. 12 Ablaufdiagramm der Generierung neuer Multiplexer Zustandsvektoren 
Fig. 13 Ablaufdiagramm eines Selbsttest wahrend des IDLE-Zyklusses 
30 Fig. 14 Ablaufdiagramm eines in das Anwendungsprogramm integrierten Selbsttests 
Fig. 15 Lookup Table zur Fehleiicorrektur 
Fig. 16 Beispiel eines fehlertoleranten Bussystems 

Fig. 17 Sichem von Registem Reg-n in chipinteme Speicher vor dem Ausfiihren der Testalgorithmen 
Fig. 18 Sichem von Registem Reg-n in exteme Speicher vor dem Ausfiihren der Ibstalgorithmen 
35 Fig. 19 Abschalten der Reg-n und Zuschalten der TestReg-n vor dem Ausfiihren der T^talgorithmen 

4.1 Detailbeschieibung der Diagramme 

Fig. 1 zeigt das Gnindprinzip der fehlertoleranten Verschaltung. Alle PAEs (0101) sind in einer Reihe angeordnet, der 

40 letzten PAE ist die zusalzliche PAER (0102) zugeordnet. Vor der ersten PAE in der Reihe ist ein Tor (0103) geschaltet, 
das die Daten zu der PAE sperrt, sofem diese PAE defekt ist. Ebenfalis ist, vor die PAER (0102) ein Tor (0105) geschal- 
tet, das die Daten zur PAER sperrt, wenn diese nichl benotigt wird (oder defekt ist). Die beiden Tore (0103 und 0105) 
sind optional und nicht zwingend erforderlich. Die Eingangsbusse (0111), die aus einer Mehrzahl von Einzelssignalen 
zusammengesetzt sind, werden uber Multiplexer (0104) und die Tore (0103 und 0105) an die PAEs geleitet. Dabei kon- 

45 nen die Daten ab einem Defekt um jeweils eine PAE nach rechts verschoben werden, bis zur PAER. Den Ausgangsbus- 
sen (0112), die aus einer Mehrzahl von Einzelssignalen zusammengesetzt sind, vorgeschaltet befinden sich ebenfalis 
Multiplexer (0106) die die Ergebnisse im Falle eines Fehlers wieder um eine Position nach Unks schieben, so daB der 
Fehler fur das Ergebnisbussystem (Menge aller 0112) nicht erkennbar ist. Die einzehien Ansteuersignale (0117) fur die 
jeweiligen Multiplexer und Tore sind zu einem Bus (OHO) zusammengefaBt und werden von einem Dekoder (0107) ge- 

50 ncricrt. Der Dekoder erhalt die Nummer der defekten PAE von der Einheit 0108, die entweder als Register oder als lad- 
barer Zahler ausgestaltet ist. Beim Einsatz einer Lookup-lbbelle zum Feststellten der defekten PAE aus dem von Er- 
roiCHK generierten Fehler ist 0108 als Register implementiert, in das die Nummer der defekten PAE geladen wird. Wild 
die fehleihafte PAE iiber eine Permutation gesucht, steilt 0108 dnen ladbaren Zahler dar, der ausgehend von 0 alle m5g- 
lichen PAEs durchzahlt, bis die Fehlerhafte gefunden wurde. Ist die Fehlerhafte bekannt, wird sie beim nachsten RESET- 

55 Vorgang direkt in den ladbaren Zahler geladen. Zum Laden des Zahlers oder Registers (0108) steht das Lade-Signal 
LOAD (0115) zur Verfugung. Um den Zahler hochzuzahlen wird das Signal COUNT (0116) zum Zahler gefuhrt. Uber 
die Signale 0114 wird das Ergebnis des Zahlers zur Speicherung zuriickgefiihrt. Die Ansteuerung des Zahlers/Registers 
und die Steuerung des zeitlichen Ablaufs wird von einer nicht gezeichneten Statemachine, einem extemen HOST oder 
einer Vorrichtung gemaB DE 196 54 846.2 ubemonmien. 

60 In Fig. 2 sind die Zustande der Multiplexer (0104 und 0106), sowie der Tore (0103 und 0105) angezeigt, wobei keine 
PAE defekt ist und die PAER (0102) nicht verwendet wird. 

In Fig. 3 sind die Zustande der Multiplexer (0104 und 0106), sowie der Tore (0103 und 0105) angezeigt, wobei die 
PAE 1 (0301) defekt ist und die PAER (0102) verwendet wird. 

In Fig. 4 sind die Zustande der Multiplexer (0104 und 0106), sowie der Tore (0103 und 0105) angezeigt, wobei die 

65 PAE m (0401) defekt ist und die PAER (0102) verwendet wird. 

In Fig. 5 sind die Zustande der Multiplexer (0104 und 0106), sowie der Tore (0103 und 0105) angezeigt, wobei die 
PAE 3 (0501) defekt ist und die PAER (0102) verwendet wird. 

Fig. 6 zeigt ein Array aus PAEs (0601), wobei je einer PAE-Zeile eine PAER (0602) zugeordnet ist und jede Zeile cine 
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separate Ansteuerung (0109, vgl. Fig. 1) besitzt. Dabei konnen cine Mehrzahl von Ansteuerungen auch zu einer einzigen 
den Zeilen ubergeoidneten Ansteuerung zusammengefaBt sein. 

Fig, 7a zeigt einen moglichen ersten Test eines Algorithmusses. Dabei sind eine Mehrzahl von PAEs als Rechenele- 
mente (0701) konfiguriert, die jeweils ihre Operation iiber einen Testvektor durchfuhren. Dabei sind die PAEs iiber Bus- 
systeme (0708) beliebiger Ausgestaltung miteinander verbunden. Eine Reihe der PAEs (0702) ist als Vergleicher konfi- 5 
guriert. Die in den Rechenelementen berechneten Werte werden in den Vergleichem mit einem voigegebenen Wert ver- 
glichen. Stimmen beide Werte nicht iiberein, liegt ein Fehler vor. Die Ergebnisse der Vergleiche werden iiber ein Bussy- 
stem (0705) an einen Multiplexer (0703) gefiihrt, der so geschaltet ist, daB er die Ergebnisse der Vergleiche aus (0702) an 
eine beliebig ausgestaltete Einheit (ErrorCHK 0706) zum Feststellen eines Fehlers und eventuell dessen Auswertung 
weitergereicht wird. Die Fehlerauswertung (0706) gibt ihr Ergebnis uber den Bus (0707) an den HOST oder die steu- 10 
emde Statemachine weiter (vgl. Fig. 1). 

Fig, 7b zeigt einen zweiten Test der iiber die selbe Matrix aus PAEs durchgefiihrl wird wie Fig, 7b. Der auszufiihrende 
Algorithmus ist derselbe, ebenso wie die zu berechnenden Werte. Dabei sind jedoch die PAEs der Zeile 0702 als normale 
Rechenelemente ausgestaltet, wobei jedoch die erste Zeile der vorher (Fig. 7a) als Rechenwerke geschalteten PAEs 
(0701) nun als Vergleicher (0711) ausgestaltel sind. Die DatenfluBrichtung auf den Bussystemen ist um 180° gedreht. 15 
Der Multiplexer (0703) ist so geschaltet daB die Ergebnisse der (gespiegelten) Vergleicher (0711) an die Fehlerauswer- 
tung (0706) weitergeleitet wird. Durch die Spiegelung der Vergleicher (0702-0711) wird erreicht, daB jede PAE tatsach- 
lich in ihrer Funktion getestet wird. Wurde die Spiegelung nicht durchgefuhrt werden, wird in einer BVE-Reihe (0702 
Oder 0711) nur die Funktion des Vergleiches, nicht jedoch jede beliebige Funktion getestet 

Die Implementierung eines weiteren Verfahrens als das den Fig. 7a und 7b zugrundeliegende kann unter Umstanden 20 
sinnvoU sein. Dabei wird die Matrix in drei Gruppen unterteilt, einer Oberen, einer Milderen und einer Unteren. In der 
oberen und unteren Gruppe werden Ergebnisse berechnet» wobei der DatenfluB der oberen Gruppe nach unten, der der 
unteren Gruppe nach oben gerichtet ist. Die mittlere Gruppe ist als Vergleicher konfiguriert und veigleicht die berechne- 
ten Werte der oberen Gruppe mit denen der unteren Gruppe. Fiir gewohnlich fllhren die obere und untore Gruppe diesel- 
ben Berechnungen durch. Sind die Ergebnisse an den Vergleichem unterschiedlich liegt ein Fehler von Auch bei diesem 25 
Verfahren ist darauf zu achten, daB die PAEs die als Vergleicher geschaltet sind in einer nacbsten Konfiguration ausrei- 
chend auf ihre Fehlerfreiheit gepriift werden. 

Die Fig. 8 zeigen mogliche Beschaltungen zum Ibst eines Chips (0801). Die Ibstdaten sind dabei extern gespeichert 
(EDST). 

In Fig. 8a befinden sich die Tfestdaten in einem externen Festspeicher ((E)PROM, ROM, Flash-ROM, etc.) (0802). Die 30 
Daten liegen in einem RAM (0808) uber den sie mit dem HOST (0805) ausgetauscht werden. Zur Speicherung der de- 
fekten PAEs, also der Zustandsvektoren der Multiplexer dient ein nicht fliichtiger Schreib-/Lese-Speicher (NV-RAM, 
EEPROM, Flash-ROM, usw.) (0807). In Fig. 8b werden die Testdaten von einem HOST (0805)in einen Teil des RAM- 
Speichers (0803) geladen und von dort aus ausgefiihrL Die Daten liegen in einem RAM (0808) iiber den sie mit dem 
HOST (0805) ausgetauscht werden. Ebenfalls moglich ist, daB der Chip selbst die Daten in den Speicherbereich (0803, 35 
0808) ladt (ohne den Einsatz eines HOSTs), z.b, direkt von einem Massenspeicher. Zur Speicherung der defekten PAEs, 
also der Zustandsvektoren der Multiplexer dient ein nicht fliichdger Schreib-/Lese-Speicher (NV-RAM, EEPROM, 
Hash-ROM, usw.) (0807). 

Die in Fig. 8a/8b vom Chip generierten Fehler werden aus dem Baustein herausgefiihrt und sind extern verfiigbar 
(0804). 40 

In Fig. 8c warden die Testdaten schrittweise von einem HOST (0805) unter Verwendung einer geeigneten Schnittstelle 
(0806) zum Chip (0801) iibertragen. Der Chip zeigt einen eventuellen Fehlerzustand (0804) durch die Schnittstelle 
(0806) dem HOST an. Die Daten liegen in einem RAM (0808) uber den sie mit dem HOST (0805) ausgetauscht werden. 

In Fig. 9 ist eine Erweiterung eines chipinternen Programm- bzw, Konfigurationsspeichers gemaB DE 196 54 846.2 
um eine BIST-Funktion gemaB dem beschriebenen Verfahren dargestellt. Dabei ist der gewohnliche Speicherbereich 45 
(0901) nach dem Stand der Technik durch einen Festspeicherbereich (0902), der fiir gewohnlich als ROM implementiert 
ist - wobei auch eine Ausgestaltung als (E)EPROM, FLASH-ROM, NV-RAM usw. moglich ware, erweitert, in dem die 
Testdaten, d. h. die Testalgorithmen und Testvektoren gespeichert sind. Am Ende des Speichers ist ein weiterer Speicher- 
bereich (0903) hinzugefiigt. Dieser ist wenige Eintrage groB und beinhaltet die Adressen defekter PAEs und/oder defek- 
tcr Busse, die in die Zahler/Register (0108) geladen werden. Dieser Speicherbereich ist als nicht fliichtiger Schreib-/Le- 50 
sespeicher ausgestaltet (Flash-ROM, EEPROM, NV-RAM, usw.). Dadurch konnen die Dat^ beim RESET ausgelesen 
werden und nach dem Ablauf dnes Testalgorithmusses, bei dem ein reparierbara Fehler festgestellt wurde, mit den ak- 
tuellen Daten iiberschrieben werden. Diese Daten werden entweder je nach Implementierung von den ZSihlem (0108, 
Bus 0114) Oder von den Lookup-Tabellen geliefert. 

Fig. 10 zeigt das Beispiel eines Standard-Prozessors mit implementierter Fehleibehebung. tJber das Businterface S5 
(1001) ist der Prozessor gemaB dem Stand der Technik an seine Peripherie angebunden. Dem Busmterface zugeordnet 
sind zwei Multiplexer (1002 und 1003), wobei 1002 zwei alternative Code-Caches (1004, 1005) und 1003 zwei alterna- 
tive Daten-Caches (1006, 1007) so ansteuert, daB jeweils nur einer der Caches verwendet wird. Damit steht jeweils ein 
Cache zum Ausgleich von Defekten zur Verfiigung und kann iiber die Multiplexer angesprochen werden. Der Code-Ca- 
che fuhrt iiber einen Multiplexer (1008) zu der KontroUeinheit (1009) des Prozessors, die in diesem Beispiel nur einmal 60 
existiert. Von der KontroUeinheit werden die Integer-Rechenwerke (1010, 1011, 1012) und die Floating-Point-Rechen- 
werke (1013, 1014, 1015) gesteuert, Dabei werden jeweils zwei Rechenwerke im Betrieb verwendet, ein jeweils Drittes 
steht zur Verfiigung, wenn jeweils eines der Rechenwerke ausfallt. Uber die bidirektionalen Multiplexer (1016, 1017) 
werden jeweils 2 Integer-Rechenwerke dem Datenbus (1018) zugeschaltet, iiber die bidirektionalen Multiplexer (1019, 
1020) werden jeweils 2 Floating-Point-Rechenwerkc dem Datenbus (1018) zugeschaltet. Der Datenbus wird Uber einen 65 
bidirektionalen Multiplexer (1021) mit dem Datencache verbunden. Der Multiplexer 1003 ist ebenfalls bidirektional aus- 
gestaltet Die Ansteuerung der Multiplexer geschieht dabei nach dem bereits beschriebenen ^Mah^en. Dabei bilden die 
Multiplexer 1002, 1008, die Multiplexer 1003, 1021, die Multiplexer 1016, 1017, sowie die Multiplexer 1019, 1020 je- 
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weils eine abhangige Gruppe. 

Im Fehlerfall kann innerhalb des Beispielprozessors somit gemafi dem beschriebenen Verfahren der Dalen- und Code- 
Cache, sowie jeweils ein Floating-Point- und Integer-Rechenwerk ersetzt werden. 

Der Ablauf eines Selbsttests ist in Fig. 11 dargeslellt. Dabei ist die Variable n, n E. (1,2, ...), der Index ailer Algorith- 
5 men und definiert den momentan verwendeten Algorithmus. Jeder Algorithmus liegt dabei in einer ersten Positionierung 
(1101), die Fig. 7a entspricht, und einer zweiten gespiegelten Postitionierung (1102), die Fig, 7b entspricht, vor. Die Va- 
riable m, m e (1, 2, ...)» ist der Index der zu berechnenden und zu vergleichenden Testvektoren. Innerhalb jedes Algo- 
rithmus wird die Menge der Testvektoren komplett durchgetestet und danach der Algorithmus gewechselt, entweder von 
1101 nach 1102 oder von 1102 auf einen neuen Algorithmus (n = n + 1). Erreicht n den Wert nach dem letzten giiltigen 
10 Algorithmus, wird der Test abgebrochen. Wird wahrend der Berechnung (1103, 1104) der Testvektoren ein Fehler fest- 
gestellt, wird eine Fehierbehandlung durchgefiihrt, die in Fig. 12a, b genauer erMutert wird. Nach erfolgreicher Fehler- 
behandlung werden alle Algorithmen emeut getestet, um sicherzusteUen, daB kein neuer Fehler durch die Koirektur ent- 
stand, wobei prinzipiell auch an der Stelie des momentan aktiven Algorithmus weiteigetestet werden konnte. 

Zur Fehierbehandlung werden zwei Verfahren vorgeschlagen: 
15 Fig. 12a zeigt die Generierung neuer Muldplexer-Zustande iiber einen Zahler. Dabei ist die Variable v, v e (0, 1, ... 
(Anzahl d. PAEs)), die Nummer der defekten PAE. Ist keine PAE defekt, gilt v = 0. Zunachst wird v so erhoht, daB die 
nachste PAE, vom PAE 1 beginnend, als defekt markiert wird. Danach wird der fehlgeschlagene Test nochmals ausge- 
fiihrt. Lauft der Test korrekt ab, ist sichergestellt, daB die PAE v defekt ist und v wird in einen nicht fliichtigen Schreib- 
Lese-Speicher (z. B. 0903) geschrieben. Schlagt der Test emeut fehl, wird v so lange erhoht, bis entweder der Test kor- 
20 rekt ablauft oder v die Position hinter der letzten PAE erreicht und damit erwiesen ist, daB die fehlerhafte Gruppe von 
PAEs nicht korrigiert werden kann, entweder weil der Fehler an anderer Stelle liegt (z. B. Bussystem), oder zwei oder 
mehrere PAEs defekt sind. 

Fig, 12b zeigt eine weniger zeitaufwendige Moglichkeit. Dabei ist die bereits beschriebene Lookup-Tkbelle integriert 
Sie erhalt als Eingangswert die fodizes m und n, sowie die Nummer des Veigleichers der den Fehler festgestellt hat 

25 Diese Nummer wird von ErrorCHK (0706) uber den Bus 0707 gelief^. Die Lookup-Tabelle liefert die Nummer v der 
defekten PAE zurQck. Danach wird der fehlgeschlagene Test nochmals ausgefiihrt. Lauft der Test korrekt ab, ist sicher- 
gestellt, daB die PAE v defekt ist und v wird in einen nicht fliichtigen Schreib-Lese-Speicher (z. B. 0903) geschrieben. 
Schlagt der Tfest emeut fehl wird davon ausgegangen, daB ein irreparabler Fehler vorliegt. 
Bei den meisten Testalgorithmen ist es moglich die Spalte der defekten PAE, jedoch nicht deren Zeile zu erkennen. 

30 Damit kann die Spalte der defekten PAE v ohne weiteres bestimmt werden, jedoch ist unbekannt, in welcher der Mehr- 
zahl von Zeilen die defekte PAE liegt. Daher ist es in solchen Fallen notwendig die Fehierbehandlung der Fig. 12a,b iiber 
alle Zeilen durchzufijhren, die an der Berechnung des Testalgorithmusses beteiligt waren, so lange, bis der Fehler fest- 
gestellt wurde oder samtliche Zeilen untersucht wurden und der Fehler unkorregierbar ist. 
Fig. 13 zeigt eine Moglichkeit einen Chip-Test wahrend IDLE-Zyklen, das sind Zyklen, wahrend denen keine Pro- 

35 grammausfiihrung stattfindet, weil auf eine Aktion (beispielsweise eine Histatureingabe) gewartet wird, durchzufiihren. 
Fiir gewdhnlich werden derartige Zyklen durch Warteschleifen im Programmcode ausgedrikkt. Es ist ohne weiteres 
moglich, bei Vorliegen einer solchen Wartebedingung eine Testroutine aufzurufen, die wahrend der Wartezeit einen Ibst 
des Chips durchfiihrt, wobei allerdings eine Echtzeitfahigkeit bei der Reakdon auf die zu wartende Aktion nicht mehr 
moglich ist. Die aus Fig. 1 1 bekannten Indizes m und n werden in Fig. 13 mit gleicher Bedeutung iibemommen. Jedoch 

40 werden die Indizes im Datenspeicher abgelegt. Samtliche relevanten Daten in dem Array werden vor dem Aufruf der lb- 
stroutine gesichert und nach der Ausfuhrung der Testroutine wieder restauriert. Beim Aufruf der Testroutine werden die 
Indizes zunachst aus dem Datenspeicher geladen. Danach wird der entsprechende Algorithmus mit den entsprechenden 
Testvektoren ausgefiihrt. Ist das Ergebnis fehlerhaft findet eine Fehierbehandlung gem. Fig. 12a, b statt. Ansonsten wer- 
den die Indizes neu berechnet und in den Datenspeicher zuriickgeschrieben. AbschlieBend wird getestet, ob weiterhin ein 

45 IDLE-Zustand vorliegt, d. h. auf eine Aktion gewartet wird. Liegt weiterhin ein IDLE-Zustand vor, wird die Testroutine 
emeut angesprungen, wobei diesesmal eine andere Berechnung - gemaB der bereits durchgefuhrten Neuberechnung der 
Indizes - durchgefiihrt wird. Liegt kein IDLE-Zustand mehr vor, wird die Programmausfiihrung normal weitergefiihrt, 
Li Fig. 14 wird eine mogliche Abwandlung aus Fig. 13 dargestellt, in der die Testroutine direkt vom Anwenderpro- 
gramm aufgerufen wird (call TEST.CHIP (m, n)). Die Testroutine wird an bestimmten geeigneten Punkten im Algorith- 

50 mus aufgerufen. Samtliche relevanten Daten in dem Array werden vorher gesichert und nach der Ausfuhrung der lb> 
stroutine wieder restauriert. Die Indizes m, n werden direlct beim Aufruf mitiibergeben. Innerhalb der Routine 
TEST_CHIP wird Algorithmus n mit den Daten m ausgefiihrt. Der Fehlertest findet gemaB Fig. 11 und Fig. 1 3 statt. Am 
Ende von TEST_CHIP werden die Indizes im Gegensatz zu Fig- 1 1 und Fig. 13 nicht neu Ijerechnet Der Rucksprung aus 
der Routine TEST_CHIP fuhrt auf die Position direkt hinter dem Aufmf "call TEST_CHIP", veigleichbar mit dem BA- 
SS SIC-Standard GOSUB ... RETURN. 

Eine mogliche Ansteuerung einer Lookup-T^belle ist in Fig. 15 dargestellt. Die Lookup-Tabelle (1501) ist als ROM 
implementiert. Die Indizes m, n; also die Kennung des momentan durchgefuhrten Testalgorithmus, die Kennung der ak- 
tuellen Tesldaten, sowie das Ergebnis (0707) der EnorCHK-Einheit (0706) werden dem ROM als Adressen (1502) zu- 
gefiihrt. Die daraus resultierenden Daten (1503) geben die Nummer der defekten PAE an. Diese Nummer wird in die Re- 

60 gister (0108) ubertragen. 

In Fig. 16 ist ein fehlertolerantes Bussystem dargestellt. Dabei ist einer Menge von gleichen Bussen (1601) ein zusatz- 
licher Bus (1602) zugeordnet. Das Bussystem besitzt Anschlusse in alien vier Himmelsrichtungen. Ober Multiplexer 
(1603) werden die Anschliisse an die Busse so geschaltet, dafi bei einem Ausfall eines Busses dessen Funktion durch den 
benachbarten (Daninterliegenden in der Horizontalen, bzw. Rechtsliegenden in der Vertikalen) Bus iibemonmien wird. 
65 Dabei werden alle Multiplexer die an einen bestimmten Bus geschaltet sind von derselben Steuerieitung angesprochen, 
beispielsweise werden die Multiplexer 1603a, die an den Bus 1601a angeschlossen sind von der Steuerieitung 1604a ge- 
steuert. Die Steuerleitungen 1604 werden von einer Einheit entsprechend 0109 aus Fig. 1 angesteuert. Die weitere An- 
steuerung und Fehierbehandlung ist prinzipiell dieselbe; wie in den vorausgehenden Hguren beschrieben. 
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Fig. 17 zeigt die Zuordnung eines chipinternen RAMs oder RAM-Bereiches (1701) zu einer Gruppe von Zellen 
(1702). Vor dem Ausfuhren der Testalgorithmen werden die intemen Register der Zellen (1702) in den RAM oder RAM- 
Bereich (1701) gespeichert. Nach dem Ausfuhren der Testalgorithmen werden die Daten in die intemen Register der Zel- 
len zunickgeschrieben. Das Schreiben und Lesen der Daten geschieht dabei uber die MultiplexerHbre (0103, 0104 und 
0105). Dadurch werden die Daten, die aus einer defekten Zelle stammen, gemaB der Stellung der Multiplexer an die zum 5 
Ersatz zugeschaltete Zelle geschrieben. Der Ablauf des Anwenderalgorithmusses wird durch das Testverfahren nicht be- 
eintrachtigt. 

Fig. 18 zeigt das in Fig. 17 beschriebene System, jedoch werden die Daten der Zellen in dem Chip (1801) in einen ex- 
temen Speicher (1802) geschrieben, bzw. aus dem extemen Speicher gelesen. 

In Fig. 19 ist die Verwendung von expliziten Testregistem TestReg-n dargestellt. Jedem intemen Register Reg-n einer 10 
Zelle (1902) ist ein ftir die Testalgorithmen verwendetes Register TestReg-n (1903) zugeordnet uber die Demultiplexer 
(das Tor) (1901) wird selektiert, in welches Register geschrieben wird; iiber den Multiplexer (1904) wird selektiert, aus 
welchem Register gelesen wird. Dabei ist die Ansteuerung der (De-) Multiplexer (1SH)1» 1904) derart, daB im normalen 
Betrieb, d. h. wahrend des Ablaufes der Anwenderalgorithmen, das Reg-n (i$K^2) selektiert wird und bei der Ausftihrung 
des Testalgorithmus das TbslReg-n (1903) verwendet wird. Die Schaltung gemaB Fig. 19 ist fur jedes relevante Register 15 
innerhalb einer Zelle implementiat. 

Nachteil der Schaltung ist, daB die Daten einer defekten Zelle nicht der als Ersatz zugeschalteten zur Verfiigung ste- 
hen. Zur Losung des Nachteils wird vorgeschiagen mittels der (De-) Multiplexer (1901, 1904) eine zusatzHche Verschal- 
tung entsprechend des ertindungsgemaBen Grundprinzipes (0103, 0104 und 0105) zu realisieren. Damit kdimen samtii- 
che Daten der ErsatzzeUe zur Verfiigung gestellt wenlen. 20 

Begriifsdefinition 

Anwenderalgorithmus Anwenderspezifisches Programm, das auf dem Chip ablSuft. 

Ausgangsmultiplexer Schaltung veigleichbar mit einem Relais, das zwischen mehieren moglichen Bussen an den Aus- 25 
gangen von PAEs auswahlt 

BIST Build In Self Test. In einen integrierten Schaltkreis implementierten Selbsttest, <L h« der TestMEM und alle Ibst- 
funktionen sind in den Schaltkreis eingeschlossen. 

Booten (Boot- Vorgang) Das Laden eines Grundprogrammes und Einstellung der Grundfunktionen nach einem Reset. 

Bus Bundelung aus mehreren Einzelsignalen/Einzelleitungen, die zusammen eine bestimmte Ubertragungsfunktion er- 30 

fuUen (Datenbus, Adressbus ...) 

EDST External Driven Self Test. In einen integrierten Schaltkreis implementierten Selbsttest, bei dem der IbstMEM au- 
Berhalb des integrierten Schaltkreises angeschlossen ist und auch Teile der Steuerung aufierhalb des Schaltkreises unt^- 
gebracht sein konnen. 

Eingangsmultiplexer Schaltung va:gleichbar mit einem Relais, das zwischen mehreren mdglichen Bussen an den Ein- 35 
gangen von PAEs auswahlt. 

ErroiCHK In einen integrierten Baustein implementierle Schaltung, die einen Fehler wahrend BIST oder EDST erkennt 
und lokalisiert.HOST Einem integrierten Schaltkreis iibeigeordnete Baugnippe oder Computer. 
IDLE Zustand in dem ein Prozessor oder ahnlicher Schaltkreis auf eine Aktion wartet und keine Verarbeitung durchfuhrt. 
Lookup-Tabelle Speich^, der anhand einer Adresse ein fest definiertes Datenwort beliebiger Breite zuriickliefert, zu- 40 
meist als ROM oder ROM-ahnlichen Speicher implementiert. 

Nachbarbus Bus, der direkt neben einem anderen Bus liegt und denselben Aufbau besitzt, 

PAE Processing Array Element gemaB DE 196 51 075.9-53. Obwohl eine PAE in der Patentanmeldung 
DE 196 51 075.9-53 ein Rechenwerk darstellt, wird der BegrifF in dieser Patentschrift allgemeiner fiir jede beliebige 
Zelle, also beispielsweise Rechenwerke, Statemachines, Speicher, gebraucht. 45 
PAER Zelle, die zusatzlich auf dem integrierten Schaltkreis implemendert ist und ersatzweise ftir eine defekte Zelle glei- 
cher Bauart verwendet werden kann. 

RESET Das Setzen oder Rucksetzen eines integrierten Schaltkreises in einen definierten Grundzustand. Hndet generell 
nach dem Anlegen von Spannung (Einschalten) statt. 

Selbsttest Automatisches Testverfahren, das in einen integrierten Baustein implementiert ist. 50 
SoUergebnisse Die Eigebnisse die von den Testalgorithmen geliefert werden miissen um die Korrektheit des integrierten 
Schaltkreises nachzuweisen. Sdmmen die Solletgebnisse nicht mit den Berechnungen uberein, liegt ein Fehler vor. 
Testalgorithmen Progranun, das den integrierten Baustein testet; es enthalt alle mathematischen Funkdonen und \^r- 
schaltungen die iiberpriift werden soUen. 

Statemachine Zustandsmaschine zur Ablaufsteuerung von komplexen Operationen, auch Sequenzei; 55 

Testalgorithmus Progranmi zum Testen des Chips oder der Zellen einer Struktur. 

Testdaten Die Menge aller Testalgorithmen, Testvektoren und Solleigebnissen. 

TestMEM Speicher in dem die Testdaten abgelegt sind. 

TesUoudne Einzelner Programmabschnitt innerhalb der Tbstalgorithmen. 

Testvektoren Daten, mit denen die Testalgorithmen ausgefuhrt werden. 60 
Tore (Gates) Schalter die Daten weiterleiten oder sperren. 

Zelle In sich abgeschlossene Baugruppe innerhalb eines integrierten Schaltkreises, bdspielswdse Rechenwerke, State- 
machines, Speicher. 

Patentansprtiche 65 
1. Verfahren zur Reparatur von integrierten Schaldoeisen, dadurch gekennzeichnet, 

daB 1. einer einzelnen oder einer Mehrzahl von Baugruppen eine weitere gleiche Zusatzbaugruppe zugeordnet ist. 



9 



DE 198 61 088 A 1 



daB 2. deh Eingangen der Baugruppen ein Multiplex^ voigeschaltet ist, der den Eingangsbus einer Baugnippe auf 
die jeweiis nachfolgende Baugruppe schalten kann, 

daB 3. den Ausgangen der Baugruppen ein Multiplexer nachgeschaltet ist, der den Ausgangsbus einer Baugruppe 
von der jeweiis nachfolgenden Baugruppe erhalten kann, 
5 daB 4. im Fall eines Defektes in einer der Baugruppen die Multiplexer so geschaltet werden, daB die defekte Bau- 

gruppe durch ihre Nachfolgende ersetzt wird, wobei die nachfolgende Baugruppe durch deren Nachfolgende ersetzt 
wird, so lange, bis die letzte Baugruppe durch die Zusatzbaugruppe ersetzt wird. 

2. Verfahren nach Anspruch 1, dadurch gekennzeichnel, daB die Ansteuerung der Multiplexer durch einen Dekoder 
erfolgt, der einen Binarwert so auskodiert, daB entweder alle Multiplexer gleich geschaltet sind oder zwei Gruppen 

10 von aufeinanderfoigenden Multipiexem entstehen, wobei die Multiplexer innerhalb einer Gruppe gleich geschaltet, 
die beiden Gruppen jedoch unterschiedlich geschaltet sind, so dafi eine defekte Baugruppe von den Multipiexem 
ausgeschlossen wird. 

3. Verfahren nach Anspruch 1 und 2, dadurch gekennzeichnet, daB der Bin^ert von einem Zahler generiert wird. 

4. Verfahren nach Anspruch 1, 2 und 3, dadurch gekennzeichnet, daB der Z^ler im Fehlerfall so lange inkremen- 
15 tiert oder dekiementiert wird, bis die defekte Baugruppe erreicht ist, oder ein Endwert eireicht wird. 

5. Verfahren nach Anspruch 1 und 2, dadurch gekennzeichnet, daB der Binarwert durch eine Lookup-lbbelle gene- 
riert wird. 

6. Verfahren nach Anspruch 1 , 2 und 5, dadurch gekennzeichnet, daB die Lookup-IhbcUe anhand des durchgefuhr- 
ten Test und des erkannter Fehlers den Binarwert der defekten Baugruppe liefert. 

20 7. Verfahren nach Anspruch 1 bis 6, dadurch gekennzeichnet, daB die Binarwerte der defekten Baugruppen in ei- 
nem chipintemen Speicher abgespeichert werden um bei einem emeuten Start des Systems sofort zur Verfiigung zu 
stehen. 

8. Verfahren nach Anspruch 1 bis 6, dadurch gekennzeichnet, daB die Binarwerte der defekten Baugruppen in ei- 
nem chipextemen Speicher abgespeichert werden um bei einem emeuten Start des Systems sofort zur ^rHigung zu 

25 stehen. 

9. Verfahren nach Anspmch 1 bis 6, dadurch gekennzeichnet, daB die Binarwerte der defekten Baugruppen von ei- 
ner iibeigeordneten Einheit verwaltet werden. 

10. Verfahren nach Anspruch 1 bis 9, dadurch gekennzeichnet, daB die Baugruppen Bussysteme darstellen. 

11. Verfahren zum Test von integrierten Schaltkreisen, dadurch gekennzeichnet, daB die Funktion des integrierten 
30 Schaltkreises getestet wird, indem ein Teslprogramm ausgefiihrt wird, wobei Testvektoren berechnet werden und 

ein Fehler vorUegt, wenn der Vergleich der Ergebnisse mit einem vorgegebenen SoU-Ergebnis falsch ist. 

12. Verfahren nach Anspruch 11, dadurch gekennzeichnet, daB der Testalgorithmus aus einer Menge von Berech- 
nungen und einem Vergleich der Berechnungen besteht. 

13. Verfahren nach Anspruch 1 1 und 12, dadurch gekennzeichnet, daB in zwei- oder mehrdimensionalen Arrays aus 
35 mehreren Rechenwerken der Testalgorithmus mindestens einmal innerhalb des Arrays getauscht/gespiegelt. 

14. Verfahren nach Anspruch 11 bis 13 dadurch gekennzeichnet, daB die Testdaten sich in einem bausteinintemen 
Speicher befinden. 

15. Verfahren nach Anspmch 11 bis 13 dadurch gekennzeichnet, daB die Ibstdaten sich in einem bausteinextemen 
Speicher befinden. 

40 16. Verfahren nach Anspmch 11 bis 13 dadurch gekennzeichnet, daB die Ibstdaten von einer Obeigeordneten Ein- 
heit geladen werden. 

17. Verfahren nach Anspmch 11 bis 16 dadurch gekennzeichnet, daB die Steuemng des Selbsttests bausteinintem 
erfolgt. 

18. Verfahren nach Anspmch 11 bis 16 dadurch gekennzeichnet, daB die Steuemng des Selbsttests durch eine iiber- 
45 geordnete Einheit erfolgt. 

19. Verfahren nach Anspmch 11 bis 18 dadurch gekennzeichnet, daB der der Selbsttest beim Start des Systems 
durchgefiihrt wird. 

20. Verfahren nach Anspmch 11 bis 19 dadurch gekennzeichnet, daB der Selbsttest wahrend der Wartezyklen des 
ablaufenden Anwendungsprogrammes (IDLE^Zyklen) durchgefiihrt wird. 

50 21. Verfahren nach Anspmch 11 bis 19, dadurch gekennzeichnet, daB der Selbsttest vom Anwendungsprogranmi 
aus aufgemfen wird oder in das Anwendungsprogramm integriert ist 

22. Verfahren nach Anspmch 11 bis 21 dadurch gekennzeichnet, daB die sich in den Rechenwerken befindlichen 
Daten vor Ablauf des Testalgorithmusses in einen chipintemen Speicher gesichert werden, nach Ablauf des Tfests 
werden die Daten wieder aus dem Speicher geladen. 
55 23. Verfahren nach Anspmch 11 bis 21 dadurch gekennzeichnet, daB die sich in den Rechenwerken befindlichen 
Daten vor Ablauf des Testalgorithmusses in einen extemen Speicher gesichert werden, nach Ablauf des Tbsts wer- 
den die Daten wieder aus dem Speicher geladen. 

24. Verfahren nach Anspmch 11 bis 21 dadurch gekennzeichnet, daB die sich die in den Rechenwerken befindli- 
chen Register vor Ablauf des Testalgorithmusses abgeschaltet werden und fOr den Tbst Testregister verwendet wer- 
60 den, nach Ablauf des Tests werden die Register wieder zugeschaltet. 
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